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@) SEQUENCES D'ADN RICHES EN TRIPLET REPETE UTILES DANS LE DIAGNOSTIC DE MALADIES A 
REPETITION TRINUCLEOTIDIOUE. 



_ La presente Invention conceme une sequence d'ADN 
transcrit et riche en triplet repete CAG/ CTG ou CGG/ GCC 
correspondant aux sequences A a L selon le tableau ainsi 
que leurs alleles et les sequences complementaires. 

Ces sequences sont utiles notamment dans le diagnos- 
tic des maladies a repetition trinucleotidique. 



276461 1 



1 

La presente invention conccme la mise en evidence de genes humains 
comportant des sequences a triplets repetes CAG/CTG ou CGG/GCC, ainsi que 
Tutilisation de ces genes dans le diagnostic et Teventuel traitement de certaines 
maladies monogeniques ou maladies polygeniques a composame hereditaire. 
5 Le polymorphisme anormal de sequences a triplets repetes CAG/CTG ou 

CGG/GCC constitue une mutation impliquee dans au moins dix maladies humaines 
hereditaires (appelees maladies a triplet repete) qui sont principalement, mais non 
exclusivement, des maladies neurodegeneratives. L'expansion (plusieurs triplets 
sumumeraires chez les malades) de sequences a triplet repete CAG/CTG est 
10 impliquee notamment dans I'atrophie spinobulbaire (SBMA), la dystrophic 
myotonique (DM), Fataxie spinocerebelleuse (SCA) SCAl, SCA2^ SCA3, et 
SCA6, Tatrophie dendato-rubro-pallydoluysiane (DRPLA), et la maladie de 
Huntington (1 a 3). L'expansion de sequences a triplet repete CGG/GCC est 
notamment impliquee dans le syndrome du X fragile (1). Enfm, le polymorphisme 
15 restreint de sequences a triplet repete CAG/CTG (par exemple un seul triplet 
sumumeraire chez les malades) est notamment impliquee dans la maladie de 
Behcet, une maladie autoimmune pour laquelle le passage de 5 a 6 codons GCT 
codant pour une polyalanine est associe a la maladie (4). 

L'expansion des CAG/CTG ou CGG/GCC (appelee egalement mutation 
20 dynamique) est souvent associee a un phenomene d'anticipation, la taille des 
repetitions etant souvent correlee de fa^on inverse avec I'age de la survenue et/ou 
la severite des symptomes. 

L'expansion des repetitions CAG/CTG peut apparaltre dans les regions 
non codantes (DM) ou codantes (par exemple SBMA, HD, DRPLA, SCAs) des 
25 transcrits. Ces transcrits sont parfois exprimes dans les tissus autres que le cerveau 
et lorsqu*ils sont traduits conduisent a des produits de genes plus grands et portant 
un domaine polyglutamine anormalement allonge (1 a 3). 

L'expansion de triplets repetes CAG/CTG peut etre tres 
importante (par exemple DM ; plusieurs centaines de triplets), moderee (par 
30 exemple HD ou SCAl ; en general plus de 35 triplets), voire 
tres moderee (par exemple SCA6 ; en general moins de 35 
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triplets). A I'etat normal, ces repetitions peuvent etre hautement polymorphiques 
(par exemple HD ou SCAl) ou faiblement a tres faiblement polymorphiques (par 
example SCA2 et SCA6) (1 a 3). Une variation d'un seul triplet a I'interieur d'un 
triplet repete court et faiblement polymorphique peut aussi:dfser une maladie (4). 
i La mise en evidence d'expansion CAG/CTG dans I'ADN genomique de 

patients (5) et/ou I'anticipation dans les families a risque a suggere que les 
mutations dynamiques sont impliquees dans SCA4, SCA5, I'ataxie cerebrale 
dominante autosomale (ADCA de type 2, aussi designee sous le sigle SCA7), et 
dans les forme familiales de la psychose maniaco-depressive (PMD) et de la 
D schizophrenie (6. 7). Dans le cas de SCA7, la mise en evidence d'expansions de 
polyglutamine a suggere que le triplet repete implique est du type triplet repete 
CAG dans une region codante (8). 

L'autisme et la demence familiale qui montrent des variabilites dans Page 
de la survenue ou dans la severite des symptomes pourraient egalement etre 
5 causees par des mutations dynamiques. 

Un assez grand nombre de maladies pourraient egalement avoir pour 
origine ou impHquer des mutations dynamiques 
la maladie de Parkinson, 
les paraplegics spastiques, 
0 - les ataxies cerebrospinale non repertoriees precedemment, 

les cataractes zonulaires, " 
les tremblements incontrolables, 
les neuropathies amyloides familiales, 
les arthrites granulomateuses familiales (maladie de Blau), 
>5 - les microsomies hemifacial es, 

certaines anemies et glaucomes, 
les desordres obsessionnels. 
Ce qui precede demontre 1' importance considerable des triplets repetes 
pour le diagnostic et le traitement de plusieurs maladies. 



2764611 



3 

La presente invention repose sur une etude systematique des repetitions 
CAG/CTG ou CGG/GCC (qui seront ci-apres designees par "[CAG]n" el "(CGG] 
n" respectivement, n etant le nombre de repetitions du triplet), cette etude ayant ete 
realisee avec des banques d' ADNc humains, celles-ci ayant s^i un premier criblage 
5 general, puis les sequences retenues ayant ete selectionnees sur la base d'un certain 
nombre de criteres permettant de s'assurcr que les sequences en cause 
appartenaient a de nouveaux genes humains et pouvaient, avec une grande 
probabilite, etre impliquees dans des maladies a triplet rep6te. Enfin, les sequences 
selectionnees ont fait I'objet d'une etude plus complete destinee a permettre leur 
10 localisation. 

Dans le cadre de la presente invention, deux ensembles d' ADNc provenant 
de cerveaux humains ont ete etudies pour analyser la presence de repetitions CAG 
en utilisant Thybridation d'oligonucleotides sur des membranes a haute densite. Les 
deux librairies ont ete obtenues a partir de ARNms a Taide d'amorce oligo-dT, 
15 Tune des librairies etant constituee de clones d'ADNc de cerveau foetal (FB) et 
Tautre librairie etant constituee de clones d'ADNc normalises de cerveau de 
nouveau-ne (NIB). 

De faQon generale, la presente invention repose sur la mise en evidence de 
certaines sequences susceptibles d'etre impliquees dans les maladies a triplet repete 
20 obtenues dans des conditions d* hybridation permettant de selectionner des ADNc 
qui contiennent un nombre de sequences [CAG] ou [CGG] superieur a 7, lesquelles 
sont plus susceptibles d'etre polymorphes dans une population malade. 

Les conditions completes d'analyse et de selection de ces differentes 
sequences ne seront pas detaillees ci-apres, seuls seront foumis les elements 
25 permettant de les localiser et de les reisoler grace, notamment, aux amorces PGR 
qui seront decrites ci-apres. 

Plus particulierement, la presente invention conceme une sequence d' ADN 
transcrit riche en triplet repete CAG/CTG ou CGG/GCC correspondant aux 
sequences A a L du tableau, ainsi que leurs alleles normaux et mutes et les 
30 sequences complementaires. 
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Par "alleles normaux" on entend designer les alleles tels quMIs ont ete 
isoles ou tels qu'il peuvent etre isoles de prelevements d'individus nomiaux, les 
' alleles mutes" etant les alleles des genes portant les sequen^ [CAG]n ou [CGG]n 
anormalement repetees. 
5 II est important de noter que, bien que certaines de ces sequences soient, 

totalement ou en partie, publiques, les sequences en cause sont pour la premiere 
fois identifiees comme faisant partie d'un gene pouvant presenter une mutation, 
lesdits genes n'ayant, par ailleurs, en eux-memes jamais ete decrils. 

Les sequences mises en evidence presentent des pourcentages 
10 d'heterozygotie (HTZ) tres variables allant de 0 a 0,75 %. Les sequences 
monomorphiques (pour lesquelles HTZ = 0) sont au moins autant susceptibles 
d'etre impliquees dans des maladies a triplet repete que les sequences polymorphes. 

Bien entendu, comme cela est mentionne precedemment, ces sequences 
sont identifiees dans le tableau et pourront, si besoin est, etre reisolees en utilisant 
15 les amorces suivantes : SEQ ID 1 a 24, les amorces 1 a 24 correspondant, par 
paire, aux sequences A a L mentionnees precedemment. 

Les sequences ainsi mises en evidence peuvent, tout d'abord, etre utilisees 
dans le cadre du diagnostic, et plus exactement d'un pronostic. En effet, comme un 
grand nombre de maladies ayant un support genetique, la mise en evidence de la 
20 presence d'une sequence presentant un nombre de repetitions anormal de triplet 
[CAG]n ou [CGG]n ne peut en elle-meme assurer de la survenue de la maladie, 
mais doit etre interpretee en fonction d'un ensemble d'autres informations pour 
permettre, soit un diagnostic tres precoce. soit eventuellement une surveillance 
specifique, surtout dans les families a risque. 
25 Ce diagnostic peut etre effectu^ en comparant la sequence d'ADN selon 

rinvention du patient avec une sequence normale pour detecter la presence de 
repetitions trinucleotidiques supplementaires. 

Plus particulierement, la presente invention conceme un procede 
de mise en e>adence des risques d'apparition d'une maladie a 
30 repetition trinucleotidique chez un patient, caracterise en ce qu'on 
compare la sequence d'ADN conforme a T invention dudit patient a 



276461 1 



5 

une sequence normale pour detecter la presence de repetitions trinucleotidiques 

supplementaires. - 

Bien entendu, il existe un grand nombre de methodes qui permettent la 
raise en evidence de triplets sumumeraires par rapport a d'es^equences normales, 
5 par exemple il est possible de mettre en evidence des differences de poids 
moleculaires en utilisant des gels et une methode de type RFLP. Mais, les niethodes 
les plus efficaces consistent a pratiquer prealablement a la mise en evidence des 
differences une operation d'amplification, par loute methode appropriee, 
notamment la methode dite "PGR", meme si d'autres methodes sont utilisables. 
10 11 n'est pas necessaire ici de decrire en detail la methode PCR, celle-ci 

permet d* amplifier de fagon considerable une sequence specifique comprise entre 
deux sequences appelees "amorces". 

Parmi les amorces utilisables dans le cadre des precedes selon rinvention. 
il faut citer les amorces des SEQ ID 1 a 24 qui constituent deux par deux des paires 
1 5 d'amorces pour chacune des sequences objet de Tinvention. 

En utilisant les amorces d6crites precedemment, on amplifie les sequences 
selon la presente invention et il est alors possible, par comparaison avec un 
echantillon normal et/ou etalon, de mettre en evidence la presence des triplets 
sumumeraires et done ia possibilite de survenue d*une maladie liee a ce type de 
20 mutation dynamique. 

II est egalement interessant de noter que certaiftes maladies a triplet repete 
sont connues pour etre associees a des variations moderees a tres faibles du nombre 
de triplets repetes, comme par exemple, SCA6 et la maladie de Behqei. Dans ces 
conditions, la methode diagnostic peut permettre, non seulement un bon pronostic 
25 de la survenue de la maladie, mais egalement d'evaluer le moment ou cette maladie 
surviendra et/ou son eventuelle severite. 

La presente invention conceme egalement les genes et leurs alleles qui 
portent, au moins en parties, ces sequences, lesdits genes etant, bien entendu, 
impliques directement dans la survenue de la maladie. 

30 
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Elle a egalement pour objet une cellule transformee exprimant tout ou 
partie des susdits genes, une proteine obtenue a partie d'une. telle cellule, une 
proteine interagissant avec la proteine precedemment ^ntionnee ainsi qu'un 
vecteur exprimant Tune de ces proteines. 
5 Les genes correspondant pourront etre exprimes dans des cellules par des 

moyens connus afin de produire les proteines correspondantes. 

II est possible d'envisager Futilisation desdites proteines dans certains kits 
de diagnostic par exemple. 

De fa^on generale, ces proteines etant impliquees dans la maladie, on 

10 souhaitera en diminuer la quantite, soit en bloquant leur expression par des 
methodes appropriees au niveau des genes ou des elements de regulation, soit en 
les fixant ou en les inactivant, par exemple en utilisant des proteines receptrices 
jouant le role de leurres. La encore, ces proteines receptrices ou inactivees pourront 
etre generees in situ par expression des sequences d' ADN correspondantes. 

15 II est egalement possible de prevoir la realisation d'anticorps monoclonaux 

correspondant a ces proteines afin d'envisager le blocage desdites proteines lorsque 
cela est souhaite, Fensemble de ces operations pouvant etre realise directement in 
vivo par exemple, en utilisant des techniques de therapie genique, en particulier en 
utilisant des vecleurs qui porteront les sequences d'expression des genes: 

20 On a mis en evidence le fait que les proteines presentant des domaines 

polyglutamines anormalement etendus avaient des proprietes d'aggregation 
anormales» tant entre elles, qu*avec d'autres proteines (11,12). Les aggregats ainsi 
crees sont probablement impliques dans la genese des maladies a triplet repete, 
c'est pourquoi il est egalement possible de prevoir une therapie dans laquelle les 

25 agents therapeutiques viendraient empecher Faggregation, soit en bloquant la 
molecule comme decrit precedemment, soit en se fixant a la molecule pour 
empecher le rapprochement avec d*autres proteines. 

On peut, dans le cadre de la therapie, prevoir d'utiliser des variants 
complets ou deletes de ces proteines, normales ou non (quant au domaine [CAGJn 

30 ou [CGG]n). 
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Les sequences selon la presente invention peuvent etre obtenues grace aux 
informations figurant au tableau et aux references qui y sont donnees et en utilisant 
les sequences d'amorce qui sont decrites dans les identificateurs de sequence ci- 

• • . 

joints. 

5 Les deux librairies utilisees sont ; 

une premiere librairie (5) contwant 60 000 ADNc 
non normalises de cerveau foetal humain (clones FB) (Laboratoire du 
Dr. Hans Lehrach, Max Plank Institute for Molecular Genetics, Berlin, 
Allemagne) sous-clones dans le vecteur p-SPORT-1 (Life 
0 Technologies, Inc., Gaithesburg, MA, USA), et 

la seconde librairie contient 40 1 28 ADNc normalises 
de cerveau de nouveau-ne (clones NIB) sous-clones dans un vecteur 
lafinid (6) et qui est une partie des ressources du consortium IMAGE 
(Lawrence Livermore Lab., Livermore, CA,) et du programme EST 
1 5 Merck WU (Washington University, St-Louis, LO, USA). 

D'autre part, un certain nombre d'autres informations ont ete recueillies en. 
utilisant Genbank Database (NCBl Bethesda. MA, USA). 

Les methodes de selection et d' analyse qui ont ete mises en oeuvre ne font 
pas en elles-memes partie de la presente invention puisque I'invention a 
20 essentiellement pour objet les sequences ainsi obtenues et leur utilisation, 
notamment, dans des methodes de diagnostic ou ffes methodes de traitement 
therapeutique. 

Dans la presente analyse, on a retenu, non seulement les sequences 
(CAG]n ou [CGG]n parfaites, mais egalement les sequences [CAG]n ou [CGG]n 
25 complexes, c'est-a-dire celles qui sont ponctuees par des insertions de triplets ; en 
effet cette presence de triplets inseres s'observe notamment dans le cas de SCAl, 
alors que tel n'est pas le cas pour SBMA, MD et HD. 

D'autre part, les nouveaux clones selectionnes a partir de librairies NIB 
sont distincts de ceux selectionnes dans le groupe FB. Ceci est en accord avec le 
30 fait que le cerveau humain exprime un grand nombre de genes distincts a des stades 
de developpement differents. 
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Enfin, des prcsentes observations il ressort que des sequences [CAG]n ou 
[CGG]n sont rares dans les ADNc humains representatifs des regions 3' des 

ARNm. . 

Bien que dans I'etat actuel de la presente invention, les sequences qui 
5 constituent Tobjet de Finvention n'aient pas ete reliees directement a des affections 
hereditaires, la presence d'extensions anormales CAG ou CGG peut etre reliee avec 
le risque de survenue d'une maladie, en parliculier lorsqu'il y a une composante 
familiale. 

11 existe un assez grand nombre de maladies qui actuellement n'ont pas ete 
10 localisees et trouveront probablement a etre reliees avec les sequences selon la 
presente invention. 

Parmi les elements additionnels qui ont ete pris en compte pour etudier la 
pertinence des sequences retenues figure Texistence eventuelle d'un cadre de 
lecture ouvert (ORF) dans lequel les sequences [CAG]n ou [CGG]n codent pour 
1 5 une extension polyglut amine. 



2764611 



c 
o 



o 
o 
-4 



vO 



cz> 



J> CL 
O C 

z 2 



oo 



o 
oo 

o 



^ i i is^; 1 i§ 1 1 



cd cd 



Z5 . • 3 Z3 ~- 

CO O O CO CO O 



o 



ex 
•c 



» * * 

— oo r^, 

— c>l — 



* ^ * ^ 
, ct\ — 



o 



ooooooooo 



8 



u 
o 



c 
_o 
o 

E 
o 

Z 



T;f v% On — '-"t ^ ^ <^ ^ 

— fN CN rn " ^ 04 



CL. 

e 

■•— » 
O 

2 
« 



• 



10 2764611 



LI3TE DZ SEQUENCtS 



(1) INrORMATIONS GENERALES: 
(i) DEPOSANT: 

(A) NOM: rONOATION JEAN DAUSSET 6 CENTRE D' ETUDES DU 

POLYMORPHISME HUMAIN (CEPH) 

(B) RUE: 27 RUE JULIETTE DOOV - ' 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75010 

(ii) TITRE DE L' INVENTION: SEQUENCES D'ADN RICHES EN TRIPLET REPETE 
UTILES DANS LE DIAGNOSTIC DE MALADIES A REPETITION 
TRINUCLEOTIDIQUE 



(iii) NOMBRE DE SEQUENCES: 24 



(iv) FORME DECHIFFEIABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Pacencin Release 31.0, Version SI. 30 (OEB) 



(2) INFORMATIONS POUR LA S£Q ID NO: 1: 



<i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) 3IBLIOTHEQUE: Max Plank Insticuto for .Xoiecular Genetics. 

Laboratory of Or nans Lehrach. B-srim. Ailemagne 

(B) CLONE: ICRFp507K15223 ^ 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: l.<5 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: I: 
CGCTCCTTCC TCTCAAG 17 
(2) INFORt-UVTIONS POUR LA SEQ ID NO: 2: 

(i) C.nRACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 13 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRIMS: sinple 
:D) CONFIGURATION: 2:n-2a'ire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) 3IBLIOTHEQUE: Ma:-: Plank Institute for ^:olecuiar Genetics, 

Laboratory of Dr bans Lehrach, Berlin. Aliemagne 

(B) CLONE: ICRFp507KlS223 
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(ix) CARACTERISTIQUE: 

(A) NpM/CLE: 1.4 5 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 
CTCAGCATCG GGTAAAAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 




- - -^ 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Genetics, 

Laboratory of Or bans Lehrach, Berlin, Allemaqne 

(B) CLONE: ICRFp5d7M22190 

{ix} CARACTERISTIQUE: 

(A) NOM/CLE: 2.52 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 
CTACAACAGA AATTCCGAC 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES OE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc ^ 

(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Genetics, 

Laboratory of Dr bans Lehrach, Berlin, Allenagne 

(B) CLONE: ICRFp507M2219.0 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 2.52 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID ::0: ; : 
33A.ACGACTG G?J\CAO 

.2) IHrORi4.ATIONS POUR LA SEQ ID NO: 5: 



I i 



) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simole 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADMc 



12 
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(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEOUE: Max Plank Institute for Molecular Genetics 

/o. ^.J:^^'^''^^'^'^^ ^^"^ Lehrach, Berlin, Aliemagne 

(B) CLONE: ICRF p507F12249 ^ 

(ix) CARACTERISTIQUE: *" 
(A) NOM/CLE: 2.99 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 
CATGGGGTTG CCGAAGAGGA G 

(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max PlanJc Institute for Molecular Genetics 

Laboratory of Or hans Lehrach, Berlin, Aliemagne 

(B) CLONE: ICRFp507F12249 

( i X ) CARACTERISTIQUE : 

(A) NOM/CLE: 2.99 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
CGCCCTTCTG GAAGGCTCAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Genetics, 

Laboratory of Or hans Lehrach, Berlin, Allenaqne 

(B) CLONE: ICRFpSO 7C1 5296 

( i:-:) CAR.^CTERISTIQUE : 

[A] NOM/CLE: 2.122 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

TGGCAGAATG GATTTGTG , 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 19 paires de bases 
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<B) type:: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc ;. 

(vii) SOURCE IMMEDIATE; 

(A) BIBLIOTHEQUE: Max Plank Institute f OF^olecu la r Genetics 

Laboratory of Dr hans Lehrach, Berlin, Allemaqne 

(B) CLONE: ICRrp507Cl 5296 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 2.122 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 
CCATCTTGAA GAAGTACTT 

(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION; lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plank Institute for Molecular Genetics^ 

Laboratory of Or hans Lehrach. Berlin, Allemaqne 

(B) CLONE: ICRFp507L13177 

(ix) CARACTERISTIQUE : 

(A) NOM/CLE: 3. S3 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO:-=9: 
TCACTCCTCC ATTGTCTGC 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES. DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simole 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE:: l<3:< Plank Ir>stit.:ce :or Koi^a^laz Genetics. 

Laboratory of Dr hans Lehrach, Borlir.. Ailemaane 
O) CLONE: ICRrp507L131 77 

(i>:) CARACTERISTIQUE: 

(A) NOM/CLE: 3.59 



(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
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CTGTCCGAGG AGGTATCG 



16 



(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CAFIACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 



(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 35570 

( i X ) CARACTERISTIOUE : 

(A) NOM/CLE: i.lO 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
ACCTTGTCCA GTCCATTG 18 
(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i> CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE; Reseau I.M.A.G.E.. Lawrer.ce Liverr^ore National 
Laboratories, Livemore, CA, USA. 

(B) CLONE: 3S570 ^ 

( i X ) CARACTERI STIQUE : 

(A) NOM/CLE: i.lO 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

GTTGTCTTTA TAAAACACAG A 21 

(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
CA) LONGUEUR: !7 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE 3RIN'S: siir.ple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., l«awrence Liverxore National 
Laboratories, Livermore, CA, USA. 




(B) CLONE: 43014 
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( i X ) CARACTERI ST IQUE : 

(A) NOM/CLE: i.l2 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 
CCCA-AGTCCC ACAATAG 

(2) INFORMATIONS POUR LA SEQ ID NO: 14: - ' 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence Livermore National 
Laboracories, Livermore, CA, USA. 

(B) CLONE: 43014 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: i . 12 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 
GCGTCAGTGG CAGAAG 

(2) iTirORMATIONS POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE OE BRINS: siraole 
(D> CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 54662 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: i.34 



(:-:i) DESCRIPTION DE LA SEQUENCE: SEQ ID ::0: 15: 
CTTTA73AT CCTGGTTC IS 

2; :?:roR:-:ATioNS pour la seo :d no: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: iinea'ire 



(ii) TYPE DE MOLECULE: ADNc 
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(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 54662 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: i . 34 



TGTGTTAGGT CCTAGAAG 

(2) INFORMATIONS POUR LA SEQ 10 NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 18 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 42315 

{ix) CARACTERISTIQUE: 

(A) NOM/CLE: i.lll 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 
CCTCCAGCAG GGTATGGC 

(2) INFORMATIONS POUR LA' SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOM3RE DE BRINS: simole 

(D) CONFIGURATION: Iineaire 

(ii) TYPE DE MOLECULE: AONc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E-, Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 4 2315 

Ci:-:! CARACTERISTIQUE: 

(A) NOM/CLE: i.lll 



(:<i) DESCRIPTIOM DE LA SEQUENCE: SEQ I D NO : 15: 
CGAACGGACC TGGGAACTG 19 
(2) INFORMATIONS POUR LA SEQ ID NO: 19: 




(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: I iS : 



(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 18 paires de bases 
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(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: iinea'ire 

(ii) TYPE DE MOLECULE; ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I . M. A. G . E . , Law're^e Livermore National 
Laboratoriesr Livermore, OA, USA, 

(B) CLONE: 52900 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: i . 129 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 
TCTGCCCCTG GAGGTGGG 18 
(2) INFORMATIONS POUR LA SEQ ID NO: 20: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 27 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE: ADNc 



<vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Reseau I.M.A.G.E., Lawrence Livermore National 
Laboratories, Livermore, CA, USA. 

(B) CLONE: 52900 

(ix) CARACTERISTIQUE : 

(A) NOM/CLE: i.l2 9 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: ^0: 
CTTCACTGGC GCTTTTTCTT CAGCTTC 27 
(2) INFORMATIONS POUR LA SEQ ID NO: 21: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 19 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: iineaire 

(ii) TYPE DE MOLECULE: ADN'c 



{vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: :!a:< Plank Ir.sci-u::-- zoz X^-locular Genetics. 

Laboratory of Or hans Lehrach. -ierlin, Alie:na9ne 
(3) CLONE: ICRFp507 ?04 1 S 9 

(ix) CAR.«\CTERISTIQUE: 

(A) NOM/CLE: 1.85 



(>:i) 



DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 21: 



IS 
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GAACAGCCTA TCTCATTCC 

(2) INTORMATIONS POUR LA SEQ ID NO: 22; 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 32 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE OE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQOE: Max Plank Institute for Molecular Genetic 

Laboratory of Dr bans Lehrach, Berlin. Allemagne 

(B) CLONE: ICREpSO? P04 11 88 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 1.85 



(xi) DESCRIPTION DE LA SEQUENCE; SEQ ID NO: 22: 
TCAGAAGTAA CTTGAATAAA TAATCATATT CG 
(2) INFORMATIONS POUR LA SEQ ID NO: 23: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 16 paires de bases 

(B) TYPE: nucleotide 

iC) NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



<vii) SOURCE IMMEDIATE: 

(A) BIBLIOTHEQUE: Max Plar.k Institute for Xolecclar Genetics 

Laboracory of Or bans Lchracn, 3crlir., Allemagne 

(B) CLONE: ICRrp50731 6262 

(i:-:) CAR.^CT£HISTIQUE: 

(A) NOM/CLE: 2.296 

(>:i) DESCRIPTION DE LA SEQUENCE: SEQ !D NO: 23: 

CACtTGGAAT CCACAC 

(2) INFOR^'J\TIONS POUR LA SEQ ID NO: 24: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 16 oaires de. bases 
(3) TYPE: nucleotici? 

(C) NOM3=^E DE sirr.oie 

(D) COr:riGURATIO:;: lineaire 

(ii) TYPE DE MOLECULE: .-.OSc 



(vii; SOURCE IMMEDIATE: 

(.A) BIBLIOTHEQUE: Max Plank Inscicuie for .Xol ecu 1 a r Generics 

Laboratory of Dr bans Lehrach, 3eri:..n, Allemagne 
(3) CLONE: ICRFpSOTBl 6262 
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(ix) CARACTERISTIQUE: 

(A) NOM/CLE: 2.2 96 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 24:"^ 
AGAGATCCTG AAGGAC 



276461 1 
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RFVENDICATIONS 

1) Sequence d'ADN transcrit riche en iriplet^repele CAG/CTG ou 
CGG/GCC correspondant aux sequences A a L selon leTableau ainsi que leurs 

5 alleles normaux et mutes et les sequences complementaires. 

2) Sequence d'ADN, caracterisee en ce qu'elle porie au moins en 
partie une sequence selon la revendication 1 

3) Precede de mise en evidence des risques d'appafition d'une 
maladie a repetition trinucleotidique chez un patient, caracterise en ce qu'on 

0 compare la sequence d'ADN selon la revendication 1 dudit patient a une sequence 
normale pour detecter la presence de repetitions trinucleotidiques supplementaires. 

4) Procede selon la revendication 3, caracterise en ce qu'on effectue 
une amplification de tout ou partie des sequences selon la revendication 1 et que 
Ton met en evidence dans le produit d'amplification la presence de repetitions 

5 trinucleotidiques supplementaires 

5) Procede selon la revendication 4, caracterise en ce que 
Famplification des sequences est effectuee avec les amorces decrites SEQ ID 1 a 24 
correspondant aux sequences A a L respectivement. 

6) Cellule transformee exprimant tout ou partie d'un gene selon la 

20 revendication 2. 

7) Proteine obtenue a partir d'une cellule transformee selon la 

revendication 6. 

8) Proteine interagissant avec une proteine selon la revendication 7. 

9) Anticorps monoclonal correspondant a une proteine selon Tune 

25 des revendications 7 ou 8. 

10) Vecteur exprimant une proteine selon Tune des revendications 7 

ou8. 

1 1) Utilisation d'une proteine selon Tune des revendications 7 ou 8, 
d'un anticorps selon la revendication 9 ou d'un vecteur selon la revendication 10 

30 pour la preparation d*un medicament. 
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